iT邦幫忙

2023 iThome 鐵人賽

DAY 29
0

生成對抗網絡( Generative Adversarial Network ,簡稱 GAN )

被稱為「生成對抗網絡」,是因為包含兩個互相對抗的神經網絡,生成器( Generator ,簡稱 G )和判別器( Discriminator ,簡稱 D )
屬於非監督式學習的,目標是生成與訓練資料相似的新樣本,新樣本與真實樣本難以區分

生成模型

  • 生成模型是學習生成高概率與訓練資料相似樣本的模型
  • GAN 的目標是生成新樣本,並能夠在訓練資料集中分配正確的概率

GAN 的工作原理

  • 生成器( Generator )
    從潛在空間( latent space )中生成資料,來騙判別器 D,讓 D 以為生成的資料是真實的,通常使用反卷積層( Deconvolutional Layers )架構,將隨機噪音轉換為逼真的圖像或資料

潛在空間
低維度的特徵表示空間
結構是自動學習的
用於輸入和生成新資料
反卷積層
將輸入特徵映射轉換為更大的尺寸

  • 判別器( Discriminator )
    識別輸入的資料是真實資料(來自訓練集)還是 G 生成的假資料,通常是卷積神經網絡( Convolutional Neural Network ),用於二元分類。

  • 對抗過程
    訓練期間生成器和判別器交替進行學習,生成器嘗試生成更真實的資料,而判別器嘗試識別這些資料,競爭性的過程使生成器不斷改進生成的資料,直到判別器無法區分真實資料和生成資料

  • 損失函數
    基於最小化損失函數,通常是二元交叉熵( Binary Cross-Entropy ),生成器和判別器都有自己的損失函數,而訓練過程的目標是找到平衡

  • 優化算法
    適當的優化算法,像隨機梯度下降( SGD )的變體,幫助生成器和判別器之間收斂到均衡點

GAN 的工作方式

  • 是一個三階段的過程
    1. D 接收資料集,分類為「真實」
    2. 從潛在表示 z 生成一個新樣本,D 接收這個樣本,分類為「假」
    3. G 被優化,使 D 將樣本分類為「真實」

GAN 的不同架構

  • DCGAN:深層卷積生成對抗網絡,用於圖像生成
  • Cycle GAN:用於形樣轉換和風格轉換
  • Super Resolution GAN:用於圖像超解析度
  • Stack GAN:生成圖片或影像,根據文字描述生成圖片
  • Style GAN:能生成高品質圖像,但需要更多的訓練資源

GAN的挑戰

  • 模式崩潰: 生成器可能陷入生成相同或非常相似資料的循環
  • 訓練穩定性: GAN 的訓練通常不夠穩定,容易出現訓練振盪或不穩定的情況

參考資料

https://developer.nvidia.com/blog/photo-editing-generative-adversarial-networks-1/
https://edge.aif.tw/gan-introduce/


上一篇
長短期記憶模型( LSTM )
下一篇
完賽了~了解機器學習歷史和感言
系列文
機器學習新手行,相信你也行!30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言